فیلترها/جستجو در نتایج    

فیلترها

سال

بانک‌ها




گروه تخصصی











متن کامل


نویسندگان: 

REZAEI SADEGH | TAHMASBI R.

نشریه: 

AMIRKABIR

اطلاعات دوره: 
  • سال: 

    2007
  • دوره: 

    18
  • شماره: 

    66-D
  • صفحات: 

    65-72
تعامل: 
  • استنادات: 

    0
  • بازدید: 

    259
  • دانلود: 

    0
چکیده: 

This paper presents a robust algorithm for Voice Activity Detector (VAD) based on GARCH (Generalized Autoregressive Conditional Heteroscedasticity) Model, Variance Gamma Distribution (VGD) and binary Markov model.GARCH models are new statistical methods that are used especially in economic time series. There is a consensus that speech signals exhibit variances that change through time. GARCH models are a popular choice to model these changing variances.Speech signal is assumed to have VGD because the VGD has heavier tails than the Gaussian Distribution (GD) and the distribution of noise signal is assumed to be Gaussian.In the proposed method, heteroscedasticity will be modeled by GARCH and then the parameters of the distributions will be estimated recursively. Finally, using a binary Markov model and comparing it with an adaptive threshold, leads to the derivation of soft and hard detection. The simulation results show that the proposed VAD is able to operate down to -5 dB and in nonstationary environments.

شاخص‌های تعامل:   مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

بازدید 259

مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesدانلود 0 مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesاستناد 0 مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesمرجع 0
نویسندگان: 

Mavaddati S.

اطلاعات دوره: 
  • سال: 

    2019
  • دوره: 

    15
  • شماره: 

    2
  • صفحات: 

    161-171
تعامل: 
  • استنادات: 

    0
  • بازدید: 

    154
  • دانلود: 

    0
چکیده: 

A new single channel singing Voice separation algorithm is presented in this paper. This field of signal processing provides important capability in various areas dealing with singer identification, Voice recognition, data retrieval. This separation procedure is done using a decomposition model based on the spectrogram of singing Voice signals. The novelty of the proposed separation algorithm is related to different issues listed in the following: 1) The decomposition scheme employs the vocal and music models learned using sparse non-negative matrix factorization algorithm. The vocal signal and music accompaniment can be considered as sparse and low-rank components of a singing Voice segment, respectively. 2) An alternating factorization algorithm is used to decompose input data based on the modeled structures of the vocal and musical components. 3) A Voice Activity detection algorithm is introduced based on the energy of coding coefficients matrix in the training step to learn the basis vectors that are related to instrumental parts. 4) In the separation phase, these non-vocal atoms are updated to the new test conditions using the domain transfer approach to result in a proper separation procedure with low reconstruction error. The performance evaluation of the proposed algorithm is done using different measures and leads to significantly better results in comparison with the earlier methods in this context and the traditional procedures. The average improvement values of the proposed separation algorithm for PESQ, fwSegSNR, SDI, and GNSDR measures in comparison with previous separation methods in two defined test scenario and three mentioned SMR levels are 0. 53, 0. 84, 0. 39, and 2. 19, respectively.

شاخص‌های تعامل:   مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

بازدید 154

مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesدانلود 0 مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesاستناد 0 مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesمرجع 0
نویسندگان: 

حق بین فریده

اطلاعات دوره: 
  • سال: 

    1383
  • دوره: 

    37
  • شماره: 

    3 (پی در پی 146)
  • صفحات: 

    141-154
تعامل: 
  • استنادات: 

    2
  • بازدید: 

    1750
  • دانلود: 

    0
چکیده: 

در زبان فارسی همچون بسیاری از زبانهای دنیا، سه نوع جهت وجود دارد که عبارتند از: معلوم، مجهول و میانه. ساختهای میانه در زبان فارسی همچون مجهول مشتمل بر یک موضوع هستند. فعلهای میانه به لحاظ صرفی، شبیه صورت معلوم خود می باشند؛ اما به لحاظ نحوی و معنایی به مجهولها شباهت دارند. در این جستار، سعی بر آن است تا ضمن تبیین ویژگیهای ساخت میانه در زبان فارسی، چگونگی اشتقاق این ساختار به عنوان ساختی متعدی بر اساس تازه ترین رویکردهای دستور زایشی - گشتاری مشخص شود.

شاخص‌های تعامل:   مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

بازدید 1750

مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesدانلود 0 مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesاستناد 2 مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesمرجع 2
مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources
نویسندگان: 

KARAMI MOLAEI M.R. | ESHAGHI M.

اطلاعات دوره: 
  • سال: 

    2009
  • دوره: 

    22
  • شماره: 

    (3 TRANSACTIONS A: BASIC)
  • صفحات: 

    225-232
تعامل: 
  • استنادات: 

    0
  • بازدید: 

    338
  • دانلود: 

    0
چکیده: 

Speech constitutes much of the communicated information; most other perceived audio signals do not carry nearly as much information. Indeed, much of the non-speech signals maybe classified as ‘noise’ in human communication. The process of separating conversational speech and noise is termed Voice Activity detection (VAD). This paper describes a new approach to VAD which is based on the Wavelet Packet Transform (WPT). Our algorithm utilizes the differences between spectral distribution of human speech (Voice) and general noise. First, the algorithm performs wavelet transform on the signal resulting in its decomposition into subbands using coefficients of WPT, and then it detects the Voice within the signal by comparing the subband energy of components between detail and approximation coefficients. Computer simulation results are given to illustrate the effectiveness of our new VAD algorithms.

شاخص‌های تعامل:   مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

بازدید 338

مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesدانلود 0 مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesاستناد 0 مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesمرجع 0
نشریه: 

امیرکبیر

اطلاعات دوره: 
  • سال: 

    1383
  • دوره: 

    15
  • شماره: 

    آ-58
  • صفحات: 

    320-337
تعامل: 
  • استنادات: 

    1
  • بازدید: 

    727
  • دانلود: 

    0
چکیده: 

آشکارسازی کلمات و دستورات گفتاری در هنگام ضبط و بازشناسی در حضور انواع وقایع اکوستیکی غیرگفتاری (پف، کلیک، ته سرفه، بازدم صدا،...) و همچنین نویزهای زمینه تداوم دار یا غیر تداوم دار را SBED یا VAD می گویند. در یک تحقیق گسترده نشان داده شده است که حدودا پنجاه درصد خطاهای یک سیستم بازشناسی گفتار، ناشی از خطای آشکارسازی دقیق مرز ابتدا و انتهای کلمات تلفظ شده (بویژه در حضور نویز) می باشد. در این تحقیق ضمن بررسی و پیاده سازی اغلب روشهای موفق، روشی ارایه نمودیم که ضمن استفاده از نقاط قوت روشهای رایج، دارای قابلیت پیاده سازی زمان زنده نیز می باشد. در این تحقیق ابتدا نقاطی از گفتار بنام نقاط MIP (نقاط با حداکثر اطلاعات) شروع و پایان کلمه تشخیص داده میشود. آنگاه با استفاده از تخمین مشخصات مدل نویز زمینه (به کمک فیلتر غیر خطی مرتب کننده توان)، نقاط شروع و پایانی کلمه و همچنین، فریمهای سکوت بین سیلابهای درون کلمه ای نیز تشخیص داده میشوند. روش فوق همراه با دو روش موفق دیگر را در بازشناسی 1500 کلمه پرمصرف (در کاربردهای IT و سرویسهای مخابراتی) مورد آزمون های مختلف قرار دادیم. در این آزمونها هم دقت روش ها و هم مقاومت آنها در مقابل انواع نویزهای زمینه (پریودیک و غیرپریودیک، ایستان و غیرایستان، رنگی و غیررنگی و...) تحت SNR های (dB 20 و 15 و 10 و 5) را مورد بررسی قرار دادیم. در تمامی این آزمونها، روش MIP بعلت استفاده از حداکثر اطلاعات قابل وصول در گفتار موفق تر بوده است.

شاخص‌های تعامل:   مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

بازدید 727

مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesدانلود 0 مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesاستناد 1 مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesمرجع 0
نویسنده: 

طاهری علی

اطلاعات دوره: 
  • سال: 

    1393
  • دوره: 

    21
تعامل: 
  • بازدید: 

    277
  • دانلود: 

    142
چکیده: 

لطفا برای مشاهده چکیده به متن کامل (pdf) مراجعه فرمایید.

شاخص‌های تعامل:   مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

بازدید 277

مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesدانلود 142
مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources
اطلاعات دوره: 
  • سال: 

    1385
  • دوره: 

    4
  • شماره: 

    3 (الف)
  • صفحات: 

    1-8
تعامل: 
  • استنادات: 

    0
  • بازدید: 

    842
  • دانلود: 

    0
چکیده: 

تشخیص نواحی سکوت از نواحی غیرسکوت دارای کاربردهای فراوانی در شاخه های مختلف پردازش گفتار است که در این میان می توان به زمینه های تشخیص گفتار، فشرده سازی اطلاعات گفتار، تخمین و حذف نویز و غیره اشاره کرد. تاکنون روش های مختلفی برای انجام عمل جداسازی پیشنهاد شده است. در این مقاله پس از بررسی روش های موجود و رایج، روش جدیدی برای تشخیص نواحی سکوت از نواحی غیرسکوت با استفاده از تبدیل موجک ارایه می شود. دلیل انتخاب ابزار موجک قابلیت بالای آن در تفکیک انرژی سیگنال در باندهای مختلف و دلخواه است. نشان داده شده است که نتایج حاصل از این روش از بسیاری جهت بر روش های قبلی برتری دارد.

شاخص‌های تعامل:   مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

بازدید 842

مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesدانلود 0 مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesاستناد 0 مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesمرجع 0
اطلاعات دوره: 
  • سال: 

    1394
  • دوره: 

    10
تعامل: 
  • بازدید: 

    487
  • دانلود: 

    244
کلیدواژه: 
چکیده: 

لطفا برای مشاهده چکیده به متن کامل (pdf) مراجعه فرمایید.

شاخص‌های تعامل:   مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

بازدید 487

مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesدانلود 244
نویسندگان: 

مودتی سمیرا

اطلاعات دوره: 
  • سال: 

    1399
  • دوره: 

    17
  • شماره: 

    3 (پیاپی 45)
  • صفحات: 

    17-36
تعامل: 
  • استنادات: 

    0
  • بازدید: 

    240
  • دانلود: 

    92
چکیده: 

بهسازی گفتار یکی از زمینه های پرکاربرد در پردازش سیگنال است که در حوزه های مختلفی مورد استفاده قرار می گیرد. در این مقاله از مفاهیم بازنمایی تُنُک و یادگیری واژه نامه به منظور حذف نوفه از سیگنال گفتار در فضای ویژگی تبدیل موجک استفاده می شود. ساختار مورد نیاز جهت بازنمایی هر مؤلفه از سیگنال به کمک مفاهیم بازنمایی تُنُک، براساس تعداد کمی از اتم های یادگیری شده امکان پذیر است. به منظور دست یابی به نتایج مطلوب در بهسازی گفتار، از روال یادگیری واژه نامه ناهمدوس بهره گرفته می شود. به کمک ضرایب تبدیل موجک، تجزیه سیگنال در زیرباندهای مختلف که شامل اطلاعات دقیقی از محتوای سیگنال هستند، فراهم می شود. در روش پیشنهادی، دو سناریوی نظارت شده و نیمه نظارت شده مورد بررسی قرار گرفته و یک الگوریتم آشکارساز فعالیت گفتاری در هر سناریو با توجه به شرط های معرفی شده بر اساس واژه نامه های یادگیری شده در گام آموزش، پیشنهاد می شود. با استفاده از نتایج خروجی آشکارساز پیشنهادی، سیگنال گفتار تخمینی طی یک روال بهسازی در گام بعد به دست خواهد آمد. نتایج گزارش شده براساس معیارهای مختلف ارزیابی عملکرد، بر توانایی این روش در زمینه کاهش نوفه سیگنال گفتار تأکید می کند. روش های پیشنهادی، توانایی بالایی را در خصوص کاهش نوفه های ناایستا به خصوص در مقادیر سیگنال به نوفه پایین دارد.

شاخص‌های تعامل:   مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

بازدید 240

مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesدانلود 92 مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesاستناد 0 مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesمرجع 0
اطلاعات دوره: 
  • سال: 

    1382
  • دوره: 

    23
  • شماره: 

    41
  • صفحات: 

    23-28
تعامل: 
  • استنادات: 

    0
  • بازدید: 

    1299
  • دانلود: 

    137
چکیده: 

لوله گذاری اتفاقی مری، علی رغم چند دهه تلاش در جهت پیشگیری و به خصوص تشخیص سریع آن، هنوز به عنوان یک عامل مهم مرگ و میر ناشی از بیهوشی مطرح است. این تحقیق، ارزیابی یک وسیله ساده، سریع و ارزان است.EDD عمدتا بر اساس امکان مکش هوا توسط یک حباب لاستیکی از لوله جاگذاری شده در تراشه یا مری کار می کند.در این تحقیق دو لوله تراشه مشابه، یکی در تراشه و دیگری در مری، در یکصد بیمار قرار دادیم و آنها را به طور تصادفی در سمت چپ و یا راست دهان بیماران تثبیت کردیم. آزمایش لوله ها برای تشخیص موقعیت آنها به وسیله EDD توسط شخصی که از موقعیت لوله آگاهی نداشت انجام گرفت.در هیچ یک ازموارد، پاسخ منفی کاذب (پرشدن حباب لاستیکی پس از اتصال دستگاه به لوله قرار گرفته در مری) مشاهده نگردید اما در دو مورد از مواردی که آزمایش لوله ها در اوایل ییهوشی انجام گرفت، عدم برگشت هوا از لوله موجود در تراشه (مثبت کاذب) احتمالا به دلیل برونکواسپاسم دیده شد.در 98 مورد دیگر تشخیص موقعیت واقعی لوله ها توسط این وسیله به آسانی میسر گردید.به نظر می رسد EDD می تواند به عنوان وسیله ای قابل اعتماد با حساسیت بالا (100 %) در تشخیص لوله گذاری مری مطرح شود اما پیشنهاد می شود در بررسی های آینده به منظور تعیین دقیق تر ویژگی آن و نزدیک تر شدن شرایط آزمایش به شرایط کاربرد عملی این وسیله، آزمایش لوله ها بلافاصله پس از لوله گذاری تراشه که احتمالا برونکواسپاسم بیشتر است، انجام گیرد.

شاخص‌های تعامل:   مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

بازدید 1299

مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesدانلود 137 مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesاستناد 0 مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesمرجع 0
litScript
telegram sharing button
whatsapp sharing button
linkedin sharing button
twitter sharing button
email sharing button
email sharing button
email sharing button
sharethis sharing button